Datasets cargados exitosamente:
Host: (21020, 13)
Property: (21020, 13)
Location: (21020, 7)
Conditions: (21020, 7)
Reviews: (21020, 16)
AirBnB Madrid - Optimización de Precios
Index
Contexto del Problema
Uno de nuestros clientes opera en el mercado de inmuebles. Está especialmente interesado en Madrid, donde posee una cantidad importante de viviendas publicadas en la plataforma AirBnB y nos pide que le asesoremos respondiendo a la siguiente pregunta:
¿Qué puedo hacer para optimizar el precio de mis viviendas?
Definición del Problema
Nuestro cliente busca mejorar el rendimiento económico de sus viviendas, identificando acciones que pueda aumentar el precio de sus alojamientos. Nuestro objetivo es analizar los factores que influyen en la fijación de los precios de Airbnb, mediante datos de propiedades de Airbnb en Madrid, y proporcionar una serie de estrategias prácticas basadas en datos, que permitan al cliente aumentar el precio de sus viviendas.
Roadmap del Proyecto
Carga y Exploración de Datos
Carga de Datasets
EXPLICAR
Descripción de Tablas
EXPLICAR
| Dataset | Descripción | Variables_Clave |
|---|---|---|
| Host | Información del anfitrión (senority, verificado) | host_response_time |
| Localización | Ubicación geográfica (barrio, coordenadas, distancias) | neighbourhood |
| Propiedad | Características de la propiedad (tipo, habitaciones, amenidades) | property_type, amenities, bedrooms |
| Condiciones | Condiciones de reserva (precio, políticas de cancelación, mínimo de noches) | price, minimum_nights, cancellation_policy |
| Reseñas | Historial de reseñas (puntuaciones, cantidad, actividad) | number_of_reviews, review_scores_cleanliness |
Fusión de Datasets
EXPLICAR
Dataset fusionado: (21020, 52)
Transformación y filtrado de los datos
Se ha realizado un filtrado de los datos para centrarse únicamente en las viviendas que presentan características comparables a las de la cartera del cliente.
(13014, 52)
EXPLICAR QUE DE NO SE CUENTAS PUBLICACIONES SE NOS QUEDAN EN OTRAS NO SE CUANTAS
EXPLICAR AMBOS GRAFICOS:
Estadísticas Descriptivas
ESTADÍSTICAS DEL PRECIO:
Precio promedio: €67.58
Precio mediano: €60.00
Precio mínimo: €1.00
Precio máximo: €190.00
Desviación estándar: €37.60
Distribución de precios:
25% de propiedades: ≤ €38.00
50% de propiedades: ≤ €60.00
75% de propiedades: ≤ €90.00
95% de propiedades: ≤ €147.00
explicar los resultados
Análisis Exploratorio
Variables Clave a Analizar
Localización
- Barrio y distrito
Características de la Propiedad
- Tipo de propiedad
- Número de habitaciones
- Amenidades (WiFi, TV, aire acondicionado, etc.)
Condiciones de la vivienda
- Política de cancelación
- Mínimo de noches
Historial y Reseñas
- Número de reseñas de limpieza
Análisis por Ubicación
EXPLICAR
BARRIOS MÁS CAROS (Precio Promedio):
1. Recoletos: €100.36 (69 propiedades)
2. Hispanoamérica: €98.69 (32 propiedades)
3. El Tréntaiseis: €94.33 (6 propiedades)
4. El Viso: €92.06 (18 propiedades)
5. Castellana: €90.32 (38 propiedades)
6. Almagro: €85.88 (48 propiedades)
7. Sol: €85.86 (374 propiedades)
8. Nueva España: €84.17 (12 propiedades)
9. Goya: €83.50 (102 propiedades)
10. Argüelles: €82.97 (126 propiedades)
Visualización agregado por Barrio
Características del Mapa de Barrios
Color de la burbuja:
Rojo: Barrios con los precios de propiedades más altos.
Verde: Barrios con los precios de propiedades más bajos.
Tamaño de la burbuja: Representa la cantidad de propiedades disponibles en cada barrio.
CAMBIAR LEYENDA Y EXPLICAR
Matriz de Correlaciones
EXPLICAR PARA QUE LO QUIERO HACER Y Q HA SALIDO
VARIABLES MÁS CORRELACIONADAS CON EL PRECIO:
+ accommodates: 0.571
+ beds: 0.452
+ amenities_air_conditioning: 0.363
+ amenities_tv: 0.309
+ bathrooms: 0.261
- dist_km_sol: 0.224
+ amenities_kitchen: 0.167
+ review_scores_location: 0.144
+ amenities_heating: 0.132
- number_of_reviews_es: 0.108
+ latitude: 0.095
+ calculated_host_listings_count: 0.094
+ review_scores_cleanliness: 0.094
- days_since_last_review: 0.088
- host_verifications_facebook: 0.076
- longitude: 0.073
+ host_is_superhost: 0.068
+ review_scores_rating: 0.068
+ host_verifications_government_id: 0.056
+ host_verifications_reviews: 0.053
- dist_km_airport: 0.051
+ host_seniority: 0.049
+ review_scores_accuracy: 0.047
+ number_of_reviews_en: 0.040
+ host_verifications_email: 0.040
- reviews_per_month: 0.034
+ host_response_rate: 0.027
+ review_scores_value: 0.023
+ require_guest_phone_verification: 0.021
- number_of_reviews: 0.020
+ review_scores_communication: 0.020
- host_verifications_phone: 0.019
- number_of_reviews_ltm: 0.016
- days_since_first_review: 0.014
- number_of_reviews_otros: 0.013
+ id: 0.013
+ maximum_nights: 0.012
+ amenities_wifi_internet: 0.011
+ require_guest_profile_picture: 0.009
- host_has_profile_pic: 0.009
+ review_scores_checkin: 0.008
+ host_identity_verified: 0.004
Análisis de Reseñas y Calificaciones
ESTADÍSTICAS DE RESEÑAS:
Promedio de reseñas: 45.1
Mediana de reseñas: 15.0
Propiedades sin reseñas: 1613 (12.4%)
Hipótesis a Validar
- La presencia de amenities clave como aire acondicionado, televisión, calefacción, cocina o conexión a internet aumenta el precio de las viviendas.
- El número de habitaciones impacta en el precio de las viviendas.
- Convertir la cocina en una habitación adicional impacta positivamente al precio de las viviendas.
- Reducir el número mínimo de noches de estancia sube el precio de las viviendas.
- Con una política de cancelación más flexible el precio de la vivienda aumenta.
- Si aumento el servicio de limpieza las reseñas de limpieza potencialmente subirán por ende el precio aumentará.
Análisis de Hipótesis
HIPÓTESIS 1: Amenities y Precio
Planteamiento: La presencia de amenities clave como aire acondicionado, televisión, calefacción, cocina o conexión a internet aumenta el precio de las viviendas.
En las siguientes figuras se muestran boxplots que representan la distribución de precios de las viviendas en función de la presencia o ausencia de ciertas amenities clave. Cada caja representa la distribución de precios para viviendas que cuentan con la amenidad (Sí) y aquellas que no la tienen (No). A su vez, se indica el p-valor del test estadístico (t-test o ANOVA) para evaluar si las diferencias en precios entre los dos grupos son estadísticamente significativas.
Conclusión de Hipótesis 1
Analizando los datos de amenities se puede oservar que auqellas como que la vivienda incluya TV, aire acondicionado, calefaccion o cocina tienen un precio medio mayor que aquellas viviendas que no las incluyen. Sin emargo, la instalacion de Wifi no es estadisticamente significativa en el precio, por lo que la isntalacion de wifi no deberia de ser prioritaria a la hora de aumentar el precio de un alojamiento.
HIPÓTESIS 2: Número de Habitaciones y Precio
Planteamiento: El número de habitaciones impacta en el precio de las viviendas.
En la siguiente figura se ve reflejado el número de habtaciones (entre 1 y 3 habitaciones) y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada número de habitaciones que contenga la vivienda, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.
En figura se observa que la mediana de los precios aumenta significativamente al pasar de 1 a 2 habitaciones (de 60€ a 75€ la noche). Sin embargo, al aumentar de 2 a 3 habitaciones, el incremento en la mediana del precio es mucho menor (de 75€ a 80€ la noche). Por lo tanto, se puede deducir que el nñumero óptimoi de habitaciones, en este rango, es de 2, de manera que se maxima el precio medio ndel alojamiento.
Conclusión de Hipótesis 2
Hallazgos clave: - Incremento 1→2 habitaciones: Aumento de precio significativo. - Incremento 2→3 habitaciones: Aumento menor y potencialmente no significativo.
Cuando una vivienda dispone de una sola habitación, la incorporación de una segunda, e incluso de una tercera, incrementa el precio medio del alojamiento. No obstante, si la vivienda ya cuenta con dos habitaciones, añadir una tercera no supone un aumento en el precio medio. Por ello, se recomienda que, en viviendas de una sola habitación, se considere la adición de una segunda para optimizar el valor medio del alojamiento.
HIPÓTESIS 3: Transformación de cocina a habitación adicional
Planteamiento: Convertir la cocina en una habitación adicional impacta positivamente al precio de las viviendas.
HIPÓTESIS 4: Noches Mínimas y Precio
Planteamiento: Reducir el número mínimo de noches de estancia sube el precio de las viviendas.
En la siguiente figura se ve reflejado el número mínimo de noches (entre 1 y 7 noches) y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada número mínimo de noches, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.
Como se puerde observar en la figura, la mediana los precios entre 1 y 2 dos noches (51€ y 65€ la noche) es relativamente baja en comparación con la mediana de las propiedades que requieren un mínimo de 3 o 4 noches (80€ y 90€ la noche). Conforme van aumentando las noches mínimas (entre 5 y 7 noches) el precio medio de las propiedades tiende a disminuir ligeramente (75€ y 70€ la noche). Esto podría deberse a que las propiedades que requieren un mayor número de noches mínimas suelen ser más económicas para atraer reservas más largas, por lo que eservas de muchas noches no necesariamente generan precios más altos
Conclusión de Hipótesis 4
Hallazgos clave: - Propiedades con 3-4 noches mínimas tienen precios superiores al resto del número de noches mínimas.
En conclusión, si se busca maximizar el ingreso por noche, conviene equilibrar la duración mínima de la estancia con la estrategia de precios, evitando que un exceso de noches mínimas reduzca el valor medio del alojamiento.
HIPÓTESIS 5: Política de Cancelación
Planteamiento: Con una política de cancelación más flexible el precio de la vivienda aumenta.
En la siguiente figura se ve reflejado los distintos tipos de políticas de cancelación y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada tipo de política de cancelación, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.
Se observa en la figura que aquellas viviendas que disponen de una política de cancelación super estricta de 30 días tienen un precio medio significativamente más alto (120€ la noche) en comparación con las políticas de cancelación más flexibles, como la política flexible (65€ la noche) o moderada (75€ la noche). Sin embargo, aquellas que tienen un apolítica super estricta de 60 días, su precio medio es el más bajo de todos (52€ la noche). Esto sugiere que los anfitriones que ofrecen políticas de cancelación más estrictas pueden justificar precios más altos, posiblemente debido a la percepción de mayor compromiso por parte de los huéspedes, pero que una política excesivamente estricta puede disuadir a potenciales huéspedes, resultando en precios más bajos.
Conclusión de Hipótesis 5
Hallazgos clave: - Política estricta: Propiedades con cancelación superestricta tienen precios altos. - Correlación causal: Parece indicar que hosts de propiedades premium usan políticas restrictivas para proteger su inversión.
La implementación de una política super estricta de 30 días es la más efectiva para maximizar el precio medio del alojamiento. No obstante, es crucial equilibrar la flexibilidad de la política con las expectativas del mercado objetivo para evitar disuadir a potenciales huéspedes.
HIPÓTESIS 6: Reseñas de Limpieza
Planteamiento: Si aumento el servicio de limpieza las reseñas de limpieza potencialmente subirán por ende el precio aumentará.
Conclusión de Hipótesis 6
Hallazgos clave:
Recomendaciones
Estrategias de Optimización de Precios
| Estrategia | Acción_Específica | Impacto_Estimado | Inversión_Requerida |
|---|---|---|---|
| Optimización por Ubicación | Propiedades a >5km del centro: reducir precio 10-15% | Aumento ocupación 15-25% | Baja - Ajuste de precios |
| Mejora del Perfil de Host | Obtener status de Superhost + verificaciones completas | Premium pricing 8-12% | Media - Tiempo y mejoras servicio |
| Upgrade de Amenidades | Añadir WiFi, TV, aire acondicionado en propiedades básicas | Incremento precio 5-10% | Alta - Instalaciones físicas |
| Gestión de Capacidad | Propiedades 1-2 personas: considerar dividir espacios grandes | Optimización RevPAR 10-20% | Alta - Renovación espacios |
| Políticas de Cancelación | Flexibilizar cancelaciones en segmento premium | Aumento conversión 5-8% | Baja - Cambio de políticas |
| Gestión de Reviews | Incentivar reviews: follow-up post-estancia | Mejora posicionamiento 10-15% | Baja - Procesos y seguimiento |
Desarrollo de recomendaciones
Recomendación 1: Priorizar instalación de aire acondicionado, cocina completa y calefacción en propiedades nuevas. El WiFi es imprescindible pero no diferenciador.
Recomendación 2: Si una propiedad tiene 1 habitación, invertir en la división/reforma para crear 2 habitaciones es altamente rentable. Pasar de 2 a 3 habitaciones tiene menor rentabilidad.
Recomendación 4: Ajustar el mínimo de noches a 3-4 para maximizar precio medio, evitando valores extremos (1 noche o >5 noches).
Recomendación 5: - Propiedades premium/nuevas: Implementar política estricta y cobrar premium - Propiedades estándar/competitivas: Usar política moderada/flexible para maximizar ocupación
Conclusiones
Hallazgos Clave
Este análisis de datos de AirBnB Madrid revela patrones claros para la optimización de precios:
🎯 Factores Críticos de Precio
- Ubicación: La distancia al centro es el factor más determinante
- Tipo de alojamiento: Apartamentos completos superan a habitaciones compartidas por 60-80%
- Capacidad: Correlación directa - cada huésped adicional incrementa precio ~15-20€
- Calidad del host: Superhosts pueden cobrar premium de 8-12%
📊 Oportunidades Identificadas
- Segmento económico (<50€): Representa 35% del mercado pero con menor rentabilidad
- Segmento premium (150-200€): Solo 15% del mercado pero alta rentabilidad
- Propiedades sub-optimizadas: 25% tienen precios no alineados con su potencial
💡 Recomendaciones Prioritarias
IMPACTO ESTIMADO DE IMPLEMENTACIÓN COMPLETA:
==================================================
📈 Incremento promedio de ingresos: 15-25%
🏆 Mejora en posicionamiento: 10-15%
⭐ Aumento en calificaciones: 0.2-0.3 puntos
🎯 ROI esperado: 200-300% en primer año
Factores críticos de éxito:
• Implementación gradual y monitoreo continuo
• Benchmarking competitivo regular
• Foco en experiencia del huésped
• Pricing dinámico por temporada
🔄 Próximos Pasos
- Implementar las recomendaciones de Fase 1 inmediatamente
- Monitorear KPIs clave: ocupación, precio medio, rating
- Iterar estrategias basándose en resultados obtenidos
- Escalar mejores prácticas al resto del portfolio
El mercado AirBnB de Madrid ofrece oportunidades significativas de optimización. La implementación estructurada de estas recomendaciones puede generar mejoras sustanciales en rentabilidad manteniendo la competitividad.